한글 음절
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
한글 음절은 현대 한글에서 11,172자를 표현할 수 있으며, 초성, 중성, 종성의 조합으로 구성된다. 옛 한글 음절은 유니코드에서 자모의 조합으로 나타나며, 유니코드 2.0 이후의 한글 음절 명명 규칙은 "HANGUL SYLLABLE (초성)(중성)(종성)" 형식을 따른다. 유니코드에서 한글 음절 인코딩은 여러 단계를 거쳐 발전해 왔으며, 초기에는 KS X 1001에 있는 2,350자만 포함되었으나, 이후 확장을 통해 현재의 11,172자를 지원하게 되었다.
더 읽어볼만한 페이지
한글 음절 | |
---|---|
개요 | |
![]() | |
유니코드 이름 | Hangul Syllables (한글 음절) |
블록 위치 | 0xAC00–0xD7A3 (44032–55203) |
유니코드 버전 | 2.0 |
글자 수 | 11,172 |
포함된 문자 | 한글 |
인코딩 | |
소스 | KS C 5601-1992 |
추가 정보 | |
비고 | 6,656자는 유니코드 1.1의 U+3400..U+4DFF에 있었지만, 4,516개의 추가 문자와 함께 유니코드 버전 2.0에서 현재 위치로 이동되었다. |
2. 현대 한글의 음절
현대 한글에서 표현할 수 있는 글자는 총 11,172자이다. 현대 한글에서 사용되는 낱자는 다음과 같다.
- 초성: ㄱㄲㄴㄷㄸㄹㅁㅂㅃㅅㅆㅇㅈㅉㅊㅋㅌㅍㅎ (19개)
- 중성: ㅏㅐㅑㅒㅓㅔㅕㅖㅗㅘㅙㅚㅛㅜㅝㅞㅟㅠㅡㅢㅣ (21개)
- 종성: ㄱㄲㄳㄴㄵㄶㄷㄹㄺㄻㄼㄽㄾㄿㅀㅁㅂㅄㅅㅆㅇㅈㅊㅋㅌㅍㅎ (27개) - 종성이 없는 경우도 있음
위의 초성, 중성, 종성을 조합해서 만들 수 있는 글자 수는 다음과 같다.
19 × 21 × (27 + 1) = 11172
이 글자들은 한글 조합형 인코딩에서는 모두 표현할 수 있으나 KS X 1001 한글 완성형 인코딩에는 자주 쓰는 2,350글자만 포함되어 있어 나머지 8,822글자는 표현할 수 없으므로 고유 명사를 표기할 때 문제가 발생하였다. 최근에 사용되는 확장 완성형 코드나 유니코드 계열에서는 11,172글자를 모두 지원하고 있다. 실제로 발음되지 못하거나 한국어에 나타나지 않는 예를 빼면 전부는 6300 미만 정도가 된다.
3. 옛 한글 음절
옛 한글 음절은 KS X 1002나 GB 12052(중국어)에만 한 글자로 등록되어 있으며, 유니코드에서는 자모를 조합하여 나타낸다. 유니코드에서 나타낼 수 있는 모든 한글 음절의 수는 다음과 같다.
- 초성: U+1100~U+115E의 95개 + U+A960~U+A97C의 29개 + U+115F의 채움 문자 1개, 총 125개
- 중성: U+1161~U+11A7의 71개 + U+D7B0~U+D7C6의 23개 + U+1160의 채움 문자 1개, 총 95개
- 종성: U+11A8~U+11FF의 88개 + U+D7CB~U+D7FB의 49개, 총 137개 (종성이 없는 경우도 포함)
이러한 초성, 중성, 종성을 조합하여 만들 수 있는 글자 수는 125 × 95 × (137 + 1) = 1,638,750이다. KS X 1026-1이 허용하지 않는 초성(채움 문자 제외)과 종성만의 조합(중성에는 채움 문자 사용)의 개수는 124 × 137 = 16,988자이며, 사실상 빈 문자인 초성 채움 문자와 중성 채움 문자의 조합 한 자 또한 있으므로 이 16,989자를 제외하면 1,621,761자가 된다.[8] 이 1,621,761 자 중, 한글 낱자를 표현하는 것은 124 + 94 + 137 = 355 자이다.
한글 자모의 초성 자리에 쓰이는 닿소리 글자는 ㄱ(g), ㄲ(kk), ㄴ(n), ㄷ(d), ㄸ(tt), ㄹ(r), ㅁ(m), ㅂ(b), ㅃ(pp), ㅅ(s), ㅆ(ss), ㅇ(ng), ㅈ(j), ㅉ(jj), ㅊ(ch), ㅋ(k), ㅌ(t), ㅍ(p), ㅎ(h) 등이 있다.
한글의 중성은 로마자로 표기할 때 ㅏ는 a, ㅐ는 ae, ㅑ는 ya, ㅒ는 yae, ㅓ는 eo, ㅔ는 e, ㅕ는 yeo, ㅖ는 ye, ㅗ는 o, ㅘ는 wa, ㅙ는 wae, ㅚ는 oe, ㅛ는 yo, ㅜ는 u, ㅝ는 wo, ㅞ는 we, ㅟ는 wi, ㅠ는 yu, ㅡ는 eu, ㅢ는 ui, ㅣ는 i로 표기한다.
한글 음절의 종성(終聲)은 자음으로, 음절의 마지막에 오는 소리이다. 종성에는 ㄱ(g), ㄲ(kk), ㄳ(gs), ㄴ(n), ㄵ(nj), ㄶ(nh), ㄷ(d), ㄹ(l), ㄺ(lg), ㄻ(lm), ㄼ(lb), ㄽ(ls), ㄾ(lt), ㄿ(lp), ㅀ(lh), ㅁ(m), ㅂ(b), ㅄ(bs), ㅅ(s), ㅆ(ss), ㅇ(ng), ㅈ(j), ㅊ(ch), ㅋ(k), ㅌ(t), ㅍ(p), ㅎ(h) 등의 자음이 올 수 있다. 예시로 밖(bak), 밖에(bakke), 안(an), 닫(dad), 달(dal), 암(am), 밥(bab), 솟(sos), 강(gang), 쿡(kuk), 툿(tut), 숲(sup), 닿(dah) 등을 들 수 있다.
4. 한글 음절 유니코드
초기 유니코드에는 KS X 1001에 있던 한글 음절 2,350자만이 포함되어 있었다.[9] 이후 4,306자가 추가되어 유니코드 1.1에는 한글 음절이 6,656자 있었지만, 당시 한글 음절 영역인 U+3400~U+4DFF 뒤에는 곧바로 한자가 위치해 있어 나머지 한글 음절을 붙여 추가할 영역이 없었다.[10][11] 1995년 대한민국의 제안으로 유니코드의 한글 음절 영역이 U+AC00~U+D7A3으로 새로 배정되고, 음절 11,172자가 가나다순으로 배열되었다.[13]
유니코드 2.0 이후의 한글 음절의 명명 규칙은 "HANGUL SYLLABLE (초성)(중성)(종성)"의 형식이다.[14][15] 예를 들어 은 과 같이 표현된다.
한글 음절 블록
유니코드에서 한글 음절을 인코딩하는 과정은 복잡했다. 초기 유니코드 1.0.0은 U+3400–U+3D2D 범위에 KS C 5601-1987의 현대 한국어 한글 음절 2,350자를 인코딩했다. 이후 버전 1.1에서 1,930개의 추가 현대 음절을 U+3D2E–U+44B7에, GB 12052-89에서 6개의 현대 음절을 U+44B8–U+44BD에, U+44BE–U+4DFF에 위에 언급된 세 가지 집합에 없는 처음 2,370개의 음절을 추가했다.
유니코드 1.1에는 세 가지 오류가 있었다.[3] U+384E는 유니코드 문자 데이터베이스에서는 삤이지만, 유니코드 1.0 및 ISO/IEC 10646-1:1993 코드 차트 및 소스 표준 매핑에 따르면 삣이다. U+40BC는 유니코드 문자 데이터베이스에서는 삣이지만, ISO/IEC 10646-1:1993 코드 차트 및 소스 표준 매핑에 따르면 삤이다. U+436C는 유니코드 문자 데이터베이스에서는 콫이지만, ISO/IEC 10646-1:1993 코드 차트 및 소스 표준 매핑에 따르면 콪이다.
버전 2.0에서는 KS C 5601-1992에서 나머지 4,516개의 가능한 음절을 추가하고 모든 인코딩된 음절을 현재의 U+AC00–U+D7AF 범위로 재정렬하여 알고리즘 방식으로 개별 자모로 분해할 수 있게 했다.[4][5]
에서는 이처럼 호환되지 않는 중요한 변경이 한국어에 유니코드를 사용하는 데이터나 소프트웨어가 존재하지 않는다는 가정하에 이루어졌다고 설명한다.
}}
이후, 유니코드는 "문자가 인코딩되면 이동하거나 제거되지 않습니다"라고 명시하는 인코딩 안정성 정책을 채택했다.[6]
다음은 한글 음절 블록에서 특정 문자를 정의하는 목적과 과정을 기록한 유니코드 관련 문서이다.
버전 | 개수 | UTC ID | L2 ID | WG2 ID | 문서 | |
---|---|---|---|---|---|---|
2.0 | U+AC00..D7A3 | 11,172 | [https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n0767.doc N767] | |||
N848 | ||||||
N1158 | ||||||
N1170 | ||||||
N1198 | ||||||
N1199 | ||||||
[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n1203.txt N1203] | ||||||
N1209 | ||||||
[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n1253.txt txt]) | ||||||
N1285 | ||||||
[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n1303.doc doc]) | ||||||
N1331 | ||||||
N1332 | ||||||
N1391 | ||||||
[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n1353.doc N1353] | ||||||
N1537 | ||||||
N1561 | ||||||
N1570 | ||||||
[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n1603.doc N1603] | ||||||
[https://www.unicode.org/wg2/docs/n1806w97.doc doc]) | ||||||
[https://www.unicode.org/wg2/docs/n1942w97.doc N1942] | ||||||
[https://www.unicode.org/wg2/docs/n1903.htm html], [https://www.unicode.org/wg2/docs/n1903w97.doc doc]) | ||||||
[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n2018.pdf N2018] | ||||||
[https://www.unicode.org/wg2/docs/n2003.pdf N2003] | ||||||
[https://www.unicode.org/wg2/docs/n2119.htm N2119] | ||||||
[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n2120.pdf N2120] | ||||||
[https://www.unicode.org/wg2/docs/n2564.pdf N2564] | ||||||
colspan="7" | |
=== 한글 음절 표기 (로마자) ===
한글 음절은 초성, 중성, 종성의 조합으로 이루어져 있으며, 각 구성 요소는 특정한 로마자로 표기된다.
==== 중성 ====
한글의 중성은 다음과 같이 로마자로 표기한다.
- ㅏ: a
- ㅐ: ae
- ㅑ: ya
- ㅒ: yae
- ㅓ: eo
- ㅔ: e
- ㅕ: yeo
- ㅖ: ye
- ㅗ: o
- ㅘ: wa
- ㅙ: wae
- ㅚ: oe
- ㅛ: yo
- ㅜ: u
- ㅝ: wo
- ㅞ: we
- ㅟ: wi
- ㅠ: yu
- ㅡ: eu
- ㅢ: ui
- ㅣ: i
==== 종성 ====
한글 음절의 종성은 음절의 마지막에 오는 소리로, 자음으로 구성된다. 종성은 다음과 같은 자음으로 표기한다.
- ㄱ: g (예: 밖(bak))
- ㄲ: kk (예: 밖에(bakke))
- ㄳ: gs
- ㄴ: n (예: 안(an))
- ㄵ: nj
- ㄶ: nh
- ㄷ: d (예: 닫(dad))
- ㄹ: l (예: 달(dal))
- ㄺ: lg
- ㄻ: lm
- ㄼ: lb
- ㄽ: ls
- ㄾ: lt
- ㄿ: lp
- ㅀ: lh
- ㅁ: m (예: 암(am))
- ㅂ: b (예: 밥(bab))
- ㅄ: bs
- ㅅ: s (예: 솟(sos))
- ㅆ: ss
- ㅇ: ng (예: 강(gang))
- ㅈ: j
- ㅊ: ch
- ㅋ: k (예: 쿡(kuk))
- ㅌ: t (예: 툿(tut))
- ㅍ: p (예: 숲(sup))
- ㅎ: h (예: 닿(dah))
4. 1. 초성
한글 자모의 초성 자리에 쓰이는 닿소리 글자는 다음과 같다. ㄱ(g), ㄲ(kk), ㄴ(n), ㄷ(d), ㄸ(tt), ㄹ(r), ㅁ(m), ㅂ(b), ㅃ(pp), ㅅ(s), ㅆ(ss), ㅇ(ng), ㅈ(j), ㅉ(jj), ㅊ(ch), ㅋ(k), ㅌ(t), ㅍ(p), ㅎ(h)4. 2. 중성
한글의 중성은 다음과 같이 로마자로 표기한다.- ㅏ는 a로 표기한다.
- ㅐ는 ae로 표기한다.
- ㅑ는 ya로 표기한다.
- ㅒ는 yae로 표기한다.
- ㅓ는 eo로 표기한다.
- ㅔ는 e로 표기한다.
- ㅕ는 yeo로 표기한다.
- ㅖ는 ye로 표기한다.
- ㅗ는 o로 표기한다.
- ㅘ는 wa로 표기한다.
- ㅙ는 wae로 표기한다.
- ㅚ는 oe로 표기한다.
- ㅛ는 yo로 표기한다.
- ㅜ는 u로 표기한다.
- ㅝ는 wo로 표기한다.
- ㅞ는 we로 표기한다.
- ㅟ는 wi로 표기한다.
- ㅠ는 yu로 표기한다.
- ㅡ는 eu로 표기한다.
- ㅢ는 ui로 표기한다.
- ㅣ는 i로 표기한다.
4. 3. 종성
한글 음절의 종성(終聲)은 자음으로, 음절의 마지막에 오는 소리이다. 종성에는 다음과 같은 자음들이 올 수 있으며, 각각에 대한 로마자 표기 규칙은 다음과 같다.- ㄱ: g로 표기한다. 예) 밖(bak)
- ㄲ: kk로 표기한다. 예) 밖에(bakke)
- ㄳ: gs로 표기한다.
- ㄴ: n으로 표기한다. 예) 안(an)
- ㄵ: nj로 표기한다.
- ㄶ: nh로 표기한다.
- ㄷ: d로 표기한다. 예) 닫(dad)
- ㄹ: l로 표기한다. 예) 달(dal)
- ㄺ: lg로 표기한다.
- ㄻ: lm으로 표기한다.
- ㄼ: lb로 표기한다.
- ㄽ: ls로 표기한다.
- ㄾ: lt로 표기한다.
- ㄿ: lp로 표기한다.
- ㅀ: lh로 표기한다.
- ㅁ: m으로 표기한다. 예) 암(am)
- ㅂ: b로 표기한다. 예) 밥(bab)
- ㅄ: bs로 표기한다.
- ㅅ: s로 표기한다. 예) 솟(sos)
- ㅆ: ss로 표기한다.
- ㅇ: ng로 표기한다. 예) 강(gang)
- ㅈ: j로 표기한다.
- ㅊ: ch로 표기한다.
- ㅋ: k로 표기한다. 예) 쿡(kuk)
- ㅌ: t로 표기한다. 예) 툿(tut)
- ㅍ: p로 표기한다. 예) 숲(sup)
- ㅎ: h로 표기한다. 예) 닿(dah)
5. 현대 한글 음절 목록
현대 한글 음절 목록은 유니코드에 포함되어 있으며, 총 11,172글자가 있다. 이 글자들은 U+AC00부터 U+D7A3까지 연속적으로 배열되어 있다.[13] 유니코드 컨소시엄은 공식 코드 차트를 PDF 형태로 제공한다.
6. 유니코드의 한글 음절 인코딩 역사
유니코드에서 한글 음절을 인코딩하는 과정은 복잡한 변화를 거쳐왔다. 초기 유니코드에는 KS X 1001에 정의된 한글 음절 2350자만이 포함되어 있었다.[9]
이후 4306자가 추가되어 유니코드 1.1에는 총 6656자의 한글 음절이 존재했지만, 당시 U+3400~U+4DFF 영역 뒤에 바로 한중일 통합 한자가 이어져 있어 추가적인 확장이 어려웠다.[10][11]
1995년, 대한민국은 유니코드에 한글 음절 영역을 U+AC00~U+D7A3으로 재배정하고, 11172자를 가나다순으로 배열할 것을 제안했다.[12][13]
유니코드 버전별 변화는 다음과 같다.
- 유니코드 1.0.0: U+3400–U+3D2D 영역에 KS C 5601-1987 기반의 현대 한글 음절 2,350자를 인코딩했다. 이 영역은 현재 CJK 통합 표의 문자 확장 A에 포함된다.
- 유니코드 1.1: KS C 5657-1991의 1,930자를 U+3D2E–U+44B7에, GB 12052-89의 6자를 U+44B8–U+44BD에 추가했다. 또한 U+44BE–U+4DFF에는 앞선 세 집합에 없는 2,370자를 추가했다. 이들은 현재 CJK 통합 표의 문자 확장 A의 나머지 부분과 역경 괘 상징 전체를 포함한다. 유니코드 1.1에는 다음과 같은 오류도 있었다.[3]
- * U+384E: 데이터베이스상으로는 '삤'이지만, 유니코드 1.0 및 ISO/IEC 10646-1:1993 코드 차트에는 '삣'으로 되어 있다.
- * U+40BC: 데이터베이스상으로는 '삣'이지만, ISO/IEC 10646-1:1993 코드 차트에는 '삤'으로 되어 있다.
- * U+436C: 데이터베이스상으로는 '콫'이지만, ISO/IEC 10646-1:1993 코드 차트에는 '콪'으로 되어 있다.
- 유니코드 2.0: KS X 1001의 나머지 4,516자를 추가하고, 모든 음절을 U+AC00–U+D7AF 영역으로 재정렬하여 알고리즘 방식으로 자모를 분해할 수 있도록 했다.[4][5]
IETF RFC 2279에 따르면, 이러한 변경은 당시 한국어 유니코드 사용자나 소프트웨어가 없다는 가정하에 이루어졌다. 하지만 이러한 가정은 논란의 여지가 있었으며, 이후 유니코드는 인코딩 안정성 정책을 채택하여 "문자가 인코딩되면 이동하거나 제거되지 않는다"는 원칙을 확립했다.[6]
유니코드 2.0 이후 한글 음절 명명 규칙은 "HANGUL SYLLABLE (초성)(중성)(종성)" 형식을 따른다.[14][15] 각 부분에 대한 세부 규칙은 다음과 같다.
; 초성
ㄱ | ㄲ | ㄴ | ㄷ | ㄸ | ㄹ | ㅁ | ㅂ | ㅃ | ㅅ | ㅆ | ㅇ | ㅈ | ㅉ | ㅊ | ㅋ | ㅌ | ㅍ | ㅎ |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
G | GG | N | D | DD | R | M | B | BB | S | SS | (없음) | J | JJ | C | K | T | P | H |
; 중성
ㅏ | ㅐ | ㅑ | ㅒ | ㅓ | ㅔ | ㅕ | ㅖ | ㅗ | ㅘ | ㅙ | ㅚ | ㅛ | ㅜ | ㅝ | ㅞ | ㅟ | ㅠ | ㅡ | ㅢ | ㅣ |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A | AE | YA | YAE | EO | E | YEO | YE | O | WA | WAE | OE | YO | U | WEO | WE | WI | YU | EU | YI | I |
; 종성
ㄱ | ㄲ | ㄳ | ㄴ | ㄵ | ㄶ | ㄷ | ㄹ | ㄺ | ㄻ | ㄼ | ㄽ | ㄾ | ㄿ | ㅀ | ㅁ | ㅂ | ㅄ | ㅅ | ㅆ | ㅇ | ㅈ | ㅊ | ㅋ | ㅌ | ㅍ | ㅎ |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
G | GG | GS | N | NJ | NH | D | L | LG | LM | LB | LS | LT | LP | LH | M | B | BS | S | SS | NG | J | C | K | T | P | H |
예를 들어 퓛은 'Hangul Syllable PWILH'로 표현된다.
다음 표는 한글 음절 블록의 문자 정의 과정에 대한 유니코드 관련 문서 목록이다.
버전 | 최종 코드 포인트 | 개수 | UTC ID | L2 ID | WG2 ID | 문서 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2.0 | U+AC00..D7A3 | 11,172 | [https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n0767.doc N0767] | 1991년 10월 WG2-파리 회의 비확정 의사록 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
X3L2/93-078 | N848 | 수정된 한국어 위치 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
https://www.unicode.org/L2/L1994-UTC/Discussion-on-Korean.TXT UTC/1994-xxx | 유니코드 기술 위원회 회의 #62: 한국어 한글 제안에 대한 토론 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
X3L2/95-031 | N1158 | 한글 문자를 추가하기 위한 한국 국가 입장 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
N1170 | 한글 문자를 추가하기 위한 N 1158의 한국어 제안에 대한 캐나다 입장 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
https://www.unicode.org/L2/L1995-UTC/UTC64-Closed-Caucus-Minutes.txt UTC/1995-021B | 비공개 코커스 회의록, UTC #64 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
N1198 | 한글에 대한 pDAM을 10646에 대한 작업 초안 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
X3L2/95-053.1 | N1199 | 한국어 코딩 배경 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n1203.txt N1203 | SC2/WG2 회의 27, 제네바의 비확정 의사록 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
X3L2/95-053 | N1209 | ISO/IEC 10646-1에 대한 PDAM 5: 한글 문자 집합 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
https://www.unicode.org/L2/L1995-UTC/UTC65-Minutes.TXT UTC/1995-xxx | 유니코드 기술 위원회 회의 #65, 의사록 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
X3L2/95-090 | 6. 1. 유니코드 버전 1.0.0초기 유니코드에는 KS X 1001에 있던 한글 음절 2350자만이 포함되어 있었다.[9]유니코드 버전 1.0.0은 U+3400–U+3D2D 범위에서 KS C 5601-1987의 현대 한국어 한글 음절 2,350자를 인코딩했다. 이 범위는 현재 CJK 통합 표의 문자 확장 A의 일부이다. 6. 2. 유니코드 버전 1.1초기 유니코드에는 KS X 1001에 있던 한글 음절 2350자만이 포함되어 있었다.[9] 이후에 4306자가 추가되어 유니코드 1.1에는 한글 음절가 6656자가 있었지만, 당시 한글 음절 영역인 U+3400~U+4DFF 뒤에는 곧바로 한자가 위치해 있어 나머지 한글 음절을 붙여 추가할 영역이 없었다.[10][11]유니코드 버전 1.0.0은 U+3400–U+3D2D에서 KS C 5601-1987의 현대 한국어 한글 음절 2,350자를 인코딩했다. 이 범위는 현재 CJK 통합 표의 문자 확장 A의 일부이다. 버전 1.1에서는 KS C 5657-1991에서 1,930개의 추가 현대 음절을 U+3D2E–U+44B7에, GB 12052-89에서 6개의 현대 음절을 U+44B8–U+44BD에 추가했다. U+44BE–U+4DFF에는 위에 언급된 세 가지 집합에 없는 처음 2,370개의 음절을 추가했다. 이것들은 집합적으로 현재 CJK 통합 표의 문자 확장 A의 나머지 부분과 현재 역경 괘 상징의 전부를 포함한다. 6. 2. 1. 유니코드 1.1의 오류초기 유니코드에는 KS X 1001에 있던 한글 음절 2350자만이 포함되어 있었다.[9] 이후에 4306자가 추가되어 유니코드 1.1에는 한글 음절가 6656자가 있었지만, 당시 한글 음절 영역인 U+3400~U+4DFF 뒤에는 곧바로 한자가 위치해 있어 나머지 한글 음절을 붙여 추가할 영역이 없었다.[10][11] 이후, 1995년에 대한민국의 제안으로[12] 유니코드의 한글 음절 영역이 U+AC00~U+D7A3으로 새로 배정되고, 음절 11172자가 가나다순으로 배열되었다.[13]유니코드 2.0 이후의 한글 음절의 명명 규칙은 "HANGUL SYLLABLE (초성)(중성)(종성)"의 형식이고, 초성, 중성, 종성의 세부적인 규칙은 아래와 같다.[14][15] 초성
6. 3. 유니코드 버전 2.0초기 유니코드에는 KS X 1001에 있던 한글 음절 2350자만이 포함되어 있었다.[9] 이후에 4306자가 추가되어 유니코드 1.1에는 한글 음절가 6656자가 있었지만, 당시 한글 음절 영역인 U+3400~U+4DFF 뒤에는 곧바로 한자가 위치해 있어 나머지 한글 음절을 붙여 추가할 영역이 없었다.[10][11] 이후, 1995년에 대한민국의 제안으로[12] 유니코드의 한글 음절 영역이 U+AC00~U+D7A3으로 새로 배정되고, 음절 11172자가 가나다순으로 배열되었다.[13]유니코드 2.0 이후의 한글 음절의 명명 규칙은 "HANGUL SYLLABLE (초성)(중성)(종성)"의 형식이고, 초성, 중성, 종성의 세부적인 규칙은 아래와 같다.[14][15]
IETF RFC 2279에서는 이처럼 호환되지 않는 중요한 변경이 한국어에 유니코드를 사용하는 데이터나 소프트웨어가 존재하지 않는다는 가정하에 이루어졌다고 설명한다.
이후, 유니코드는 "문자가 인코딩되면 이동하거나 제거되지 않습니다"라고 명시하는 인코딩 안정성 정책을 채택했다.[6] 다음은 한글 음절 블록에서 특정 문자를 정의하는 목적과 과정을 기록한 유니코드 관련 문서이다.
|